ULISSES: un Integrated Development Environment desarrollado para la anotación de un corpus romancístico
نویسنده
چکیده
Ulisses is an Integrated Development Environment developed for the annotation of a corpus comprised of ballads from the portuguese modern oral tradition, featuring a modular structure which allows the integration of new tools and functionality.
منابع مشابه
De la especificidad de un corpus romancístico a la creación de una nueva aplicación: ULISSES
On this paper we intend to account for how the singularities of a corpus comprised of versions from the romancero of the portuguese modern oral tradition , totalling 1721 texts, have compelled us to build a new software application that answers the needs and goals of our research; afterwards we’ll describe the Ulisses application, the IDE which was specifically developed for the annotation and ...
متن کاملHow Does the Granularity of an Annotation Scheme Influence Dependency Parsing Performance?
The common use of a single de facto standard annotation scheme for dependency treebank creation leaves the question open to what extent the performance of an application trained on a treebank depends on this annotation scheme and whether a linguistically richer scheme would imply a decrease of the performance of the application. We investigate the effect of the variation of the number of gramma...
متن کاملUn modelo para detectar la similitud semántica entre textos de diferentes longitudes
Resumen En el presente trabajo se desarrolla un modelo para resolver el problema de similitud semántica entre textos de diferente longitud. Se propone extraer caracteŕısticas léxicas, caracteŕısticas basadas en conocimiento y caracteŕısticas basadas en corpus, con el objetivo de desarrollar un modelo de aprendizaje supervisado. El modelo fue desarrollado utilizando regresión loǵıstica de la her...
متن کاملAnotación automática de datos acerca de la reputación de los políticos en redes sociales
Resumen. Recientemente, la minerı́a de opinión en Twitter, por medio de la Recuperación de Información (RI) y del Procesamiento de Lenguage Natural (PLN) atrajo interés en la investigación polı́tica. Sin embargo, la obtención de datos anotados de dominio especı́fico sigue siendo un paso manual muy costoso. Además, la cantidad y calidad de estas anotaciones pueden ser crı́ticas en relación al rendim...
متن کاملAspectos ortográficos, léxicos y morfosintácticos del etiquetado lingüístico de un corpus de informática en lengua gallega
Resumen. En este trabajo se examinan algunos aspectos del etiquetado lingüístico de un corpus técnico de informática en lengua gallega, en lo que respecta a cuestiones ortográficas, léxicas y morfosintácticas. En primer lugar, presentamos la características del corpus analizado y algunas de las aplicaciones de su procesamiento. A continuación, mostramos las técnicas empleadas en su anotación mo...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Procesamiento del Lenguaje Natural
دوره 37 شماره
صفحات -
تاریخ انتشار 2006